谢幸:我能不能再造一个自己? | 造就
https://v.qq.com/txp/iframe/player.html?vid=c0382s40wgr&width=500&height=375&auto=0
第162位讲者:谢幸
微软亚洲研究院社会计算组主任研究员
中国科学技术大学兼职博士生导师
我有一个3岁的女儿,她非常喜欢读书。大概两个月前我给她买了一本绘本,名字叫「我能不能再造一个自己」。
这个绘本描述了一个非常淘气的孩子,他厌倦每天规律的生活。他不想午睡,不想按时吃饭,也不想去幼儿园。这孩子就想,我能不能造一个机器人,训练它做我要做的事情,这样我自己就可以随心所欲了。
于是他就去买了个最便宜的机器人进行训练,他第一步需要教机器人怎么样行动才能像他。他就告诉机器人自己所有的信息,比如姓名、年龄、身高、体重,还有父母、弟弟,甚至宠物,还有他生理、心理各方面的特点。他期望这机器人最终能够变得跟他一模一样,能够取代他。
我发现这绘本的作者脑洞很大,他在想和我们一样的问题。而且这绘本还告诉我们,我们首先最重要的就是理解自己。
这么多年来,我们花了很多时间做用户画像。什么叫用户画像呢?其实就是通过用户产生的各种数据,试图去理解用户的性格以及他们的各种属性、年龄、性别、兴趣爱好等。
如果要很深入地做这方面研究,比如说从数据里学到人的性格和情感呢,我们发现并不容易。但是在心理学领域,这些已经研究了上千年。
公元前400年左右,有一个古希腊医学家叫希波克拉底,他提出了一个叫「四体液说」的概念,他认为人体中有四种体液:黑胆汁、黄胆汁、血液和黏液。
这四种体液的分布决定了人的性格,比如说如果你觉得比较容易抑郁,那可能是因为你黑胆汁比较多;你比较乐观,则是血液比较多;如果你黄胆汁多,可能会冲动易怒;黏液比较多,就相对比较冷静和理智。
当然在现代医学看来,这种体液学说并不科学,但是他对人格的探讨和分类是很有启发意义的,以致于后来的心理学家一直在研究人格可以怎样进行分类。
我们和心理学家进行了很多交流,并从中发现了一个很有意思的事实,就是在心理学中,人格的研究和语言的使用之间有紧密的关系。而在计算机科学也对语言有很多研究,我们称之为自然语义理解。
心理学里面有一个叫「词汇学假说」,就是指在研究人格时,我们不用漫无目的地去观察各种各样的人,而是可以简单一点,直接去看人类语言中相关的词汇就可以了。
比如你有一个朋友,我想让你介绍一下,你可能用一段很长的话来描述。你可能说「他特别喜欢说话,人很多的时候,他会特别高兴,随时都会听到他在说话,是个大话痨。」这么一大段,其实用一个词来概括就是「健谈」。
人类很聪明,如果某种人经常出现,而且非常典型的话,人们一定会发明一个词来简练地概括这种特征。在100多年前的时候,心理学家们去翻阅词典,从里面找到了18000多个单词都可以描述人,然后从这当中又找到4000多个词可以描述人格。
虽然这些词好像已经很少了,但实际操作起来还是很复杂的。就像刚才说的,如果我问你的朋友到底是怎样一个人,你会说他外向可以打5分,勇气可以打3分,冷静可以打4分……打完这4000多个维度估计我也睡着了。
所以心理学家们就想,我也许不用这么复杂。他们发现外向的人一般也比较健谈,冷静的人相对也比较理智,也了能比较内向,词和词之间存在一定相关性。通过一些因素分析的方法,心理学家找到这些相关性,这4000多个词再归类,归到比较小的维度里。
现在比较流行的是一种叫「大五人格理论」,就是外向性、随和性、神经质、尽责性和开放性。
心理学家整理的这些词汇,以及生成这样的人格分类体系,很多方法都是数据驱动的,跟计算机科学有很多紧密的联系。我们最关注的一点就是,能不能自动计算用户的大五人格呢?
其实在心理学里面有一种方法叫行为测量。可以想象,如果我能每天观察一个人的时间足够长的话,其实不用问问题也大概能猜出他是什么性格。但行为测量有个很大问题,就是需要大量行为数据做支撑,这在过去比较麻烦。
但现在这个事情比较容易了,为什么呢?因为有了社交网络,大家会主动告诉别人自己在干嘛。比如你今天来听演讲会发一条朋友圈,这体现你某方面的特质;你去高大上的餐厅吃饭,你发张照片秀一下,这也会体现了你的特质。
我们把所有用户提供的数据结合起来,就可以相对准确地去猜测。我们提出了一个「人格推测模型」,其特点就是去集成不同来源的用户数据,包括你发的文字、图片、常用的表情符号,以及你填写的个人资料等。
你们可能会说,有了这个模型以后,怎样进行训练呢?其实还是要和心理学家合作,因为首先我们得标注这些用户的行为特点和人格特征,它们之间是否有映射或者联系。把这样的映射输入模型里面,我们才能训练出一个好的模型。
我们此前找了愿意主动贡献数据的志愿者,也做了问卷调查。这样对新的用户就不用再做调查了,可以自动用模型来计算。
比如说我们可以计算你发表的文字和性格之间的关系,得出文字和每个维度是正相关还是负相关。如果经常在朋友圈里面写「青春」「自我」的人可能比较外向;经常写「面对」「失败」的人外向性得分较低,就比较内向。
还有些人他经常会写「时代」「社会」「成功」等非常正能量的词汇,他们尽责性比较高。还有一些写「随便」「萌萌」「气质」这些词的人,我们发现他尽责性比较低。所谓尽责性是指他更在乎结果还是过程的,在乎结果的人就是尽责性比较高,在乎过程的人则尽责性比较低。所有的这些人格都没有好坏之分。
大家可以看看自己发表的文字,看你的朋友圈写了一些什么呢?体现你什么样的性格?
我们还计算了头像和大五人格的相关性,比如内向的用户可能不太喜欢用正脸,更偏好用侧脸,或者看不清全脸的这种照片;还有比较外向的用户可能用很夸张的表情,或者卡通的照片。比较开放的用户经常会用一些合影或活动的照片,开放性比较低的人可能经常用自拍做头像。
所以大家可以看你的头像是什么,是不是暴露了你的性格?
我们做了很多用户理解和人格推测的工作,但下一步呢?我们真正的目标是想搭建一个更像人的机器人。
其实很多科幻作品都在讲类似的主题,我印象特别深刻的是英剧《黑镜》,它第二季的一集叫《Be right back》,里面说有一家人工智能公司可以通过用户提供的社交网络数据和聊天数据,来生成一个虚拟人。它可以跟别人聊天,交流起来跟那个人一样。
到了去年,这就变成真事了。
有一个俄罗斯创业者的朋友去世了,他非常痛苦,就在想那我怎么去悼念他?他就收集了朋友的8000多条短信,用其训练了一个机器学习的聊天模型。你可以跟这个模型对话,它可以用他朋友的话语方式来回应你,就好像这个人还活着一样。
我们相信,随着研究进一步深入,还会有很多问题冒出来。我们需要和心理学家一起来合作,让机器人更逼真,更像人类。这里可能会有一个问题,做这样的聊天机器人有什么用呢?
早在1964年,MIT的一个学者Joseph,他实现出了一个可以通过文本进行聊天的机器人,名叫Eliza。它是一个心理治疗师,它用编好的规则理解用户输入的话,理解完成后会产生回复。
它这些回复基于一个心理学家罗杰斯提出的以人为本的治疗方式,它强调的是谈话的过程,怎样尊重用户,怎样具有同理心,其实更多的是倾听,它会让用户尽可能的倾诉。
但就算是这样,当时使用的用户已经觉得非常震惊,包括Joseph的秘书,他觉得背后像是有真人在操作一样。
受启发于Eliza项目,我们自己也做了一个心理治疗师叫DiPsy,它的目的实际上也是想帮助那些有心理问题的人来缓解心绪。我们采用了最近流行的CBT认知行为疗法和Mindfulness正念疗法。当然我们也不是基于既定规则的,而是采用机器学习的方式来理解用户的输入语言。
在未来我们希望这个聊天机器人能够帮助解决实际的社会问题,比如有很多农村留守儿童,他们的父母在外地打工,这些孩子非常孤独,我们是不是可以通过这样的聊天机器人帮助他们缓解一些心理问题,并陪伴他们呢?
DiPsy项目首先要用自然的方式引导用户说出他想说的事,但这还不够,我们希望通过用户数据呢进一步诊断和分析他到底有什么样的心理问题,他的性格是怎样的。
如果还能在聊天的过程中发现合适的时机,我们会试图去干预聊天的过程,帮助用户缓解情绪,这是我们的最终目标和理想。这样的我们就可以真正服务于广大用户了。
我们希望让机器人拥有像人类一样的思维,当人类需要的时候,能够真的帮助人类,去陪伴他们。
谢谢大家!
点击标题 查看往期回顾